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Prufungsantrag gem. § 44 PatG ist gestellt 

@ Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und -Analyse in einenn 
Paralleirechnersystem 

(g) Es wird ein Verfahren der sichtbaren Darstellung von 

Ergebnissen der LeistungsOberwachung und -analyse fur ein 

Paralleirechnersystem beschrieben, bei dem eine Vielzahf 

von Prozessoren ein parallel verarbeitendes Programm aus- 

fuhren, welches aus einer Vieizahl von Routinen zusammen- 

gesetzt ist. Zuerst werden Informationen hinslchtlich der 

AusfOhrungszeit von jeder Routine in einer Realzeitweise 

gesammelt wahrend das Programm gleichlaufend durch die 

Vielzahi von Prozessoren ausgefuhrt wird. Zweitens werden 

Maximal-, Mittel- und Minimalwerte der Ausfuhrungszeit 

von jeder Routine berechnet, basierend auf den Informatio- 
nen, die fur die Vieizahl der Prozessoren gesammelt wurden. 

Drittens werden die gesammelten Informationen in Form 
^ eines Ausfuhrungsprofils zusammengefaSt oder summiert 

und werden in graphischer Form dargestellt, und zwar unter 

Ven/vendung von Balkengraphiken, Kreisgraphiken oder Ra- 
^ darkarten. Fur jede Prozedur oder Programmschleife klassifi- 
& ziert das vorliegende Verfahren die Prozentsatze der Anwen- 
€^ der-Netto-Programmausfuhrung, Kommunikation, Synchro- 
@ nisation und anderer parallel laufender Zusatzaufgaben, und 
^ zeigt auch deren Abweichungen an. Dieses Merkmal unter- 
^ stutzt den Anwendcr darin, das aktuelie Programmverhalten 

zu verstehen und das parallel verarbeitende Programm 
^ abzustimmen. ^ 
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Beschreibung 



HINTERGRUND DER ERFINDUNG 
1. Gebiet der Erfindung 

Die vorliegende Erfindung betrifft ein Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungs- 
uberwachung und -analyse in einem Paralielrechnersystem, welches eine Viekahl von Prozessoren verwendet, 
und betrifft spezieller ein Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und 
-analyse in einer bedienungskorafortableren und umfassenden Weise. Die vorliegende Erfindung betrifft auch 
ein computer-lesbares Medium, welches mit einem Computerprogramm codiert ist, bei welchem das zuvor 
genannte Verfahren realisiert wird 

Z Beschreibung des verwandten Standes der Technik 

Parallele Verarbeitungstechniken spielen eine entscheidende Rolle bei der Befriedigung von heutzutage 
wachsenden Anforderungen nach Hochleistungsrechnersysteraea Ein Paralielrechnersystem fuhrt eine Anwen- 
dung aus, indem es eine Vielzahl von Prozessoren verwendet, die parallel laufen, wodurch ein hoher Verarbei- 
tungsdurchgang erzielt wird Die Entwicklung von Software fur ein Paralielrechnersystem bringt jedoch ira 
allgemeinen einige Schwierigkeiten bei der Programmaustestung, Bewertiing und Leistungsabstunmung mit 
sich,undzwaraufgrundderenkomplexerNatur. ^ , * j- 

Um das Problem zu losen, werden Leistungsanalysierer als ein gunstiges Werkzeug emgefuhrt, welches die 
Software-Programmierer darin unterstutzt, das Verhalten eines Parallelprogranuns beim Testen zu ubenvachen 
und dessen Leistung zu messen. Der Analysierer verarbeitet die gesammelten Daten und prasentiert das 
Ergebnis demAnwender in Form eines aufsunimiertenAusfuhrungsprofils. 

Ein herkommlicher Leistungsanalysierer erzeugt ein Ausfuhrungsprofil von einzelnen Prozessoren, welches m 
solcher Weise aufsummiert ist, daB die gesamte Verarbeitungszeit in einige Kategorien klassifiziert ist, enthal- 
tend Netto-Betriebszeit und Leeriaufzeit usw. Das Ausfuhrungsprofil jedes Prozessors wird getrennt m Form 
einer Balkengraphik Oder ahnlichem dargestellt 

Dieses herkommliche Verfahren der Darstellung von Ausfuhrungsprofilen ist jedoch fur Software-Entwick- 
lungsingenieure in keiner Weise vorteilhaft. wenn das Parallelverarbeitungssystem hunderte von Prozessoren 
enthalt Die an einem Analysierer-Bildschirm dargestellten Informationen sind zu umfangreich, um das Pro- 
grammverhalten richtig verstehen zu konnen, da zu viele Prozessoren paraUel laufen. In einem solchen Fall kann 
der herkommUche Analysierer die Schwierigkeit dadurch etwas mildem, indem eine gewisse statistische Verar- 
beitung hinsichtlich der gewonnen Rohdaten angewandt wird Dies erlaubt es, das Gesamtprogxammverhalten 
Oder die mitdere Leistung der Prozessoren den Ingenieuren in einer verstandlicheren Art darzubieten. 

Jedoch sind die Informationen, die durch diesen herkomralichen Leistungsanalysierer vorgesehen werden, fur 
die Software-Entwicklungsingenieure nicht ausreichend, um die Systeraqualitat bzw. Leistung voUstandig ver- 
stehen zu konnen und die detaiUierte Beziehung zwischen den Prozessen verstehen zu kdnnen, die parallel 
laufen. 

ZUSAMMENFASSUNG DER ERFINDUNG 

Unter Einbeziehung des oben gesagten, besteht eine erste Aufgabe der vorliegenden Erfindung darin, ein 
verbessertes Verfahren zur sichtbaren DarsteUung von Ergebnissen der Leistungsuberwachung und -analyse m 
einem Paralielrechnersystem zu schaffen, welches Prozentsatze der Anwender-Netto-Progranmiausfuhrung, 
Kommunikation, Synchronisation und anderer paraUel ablauf ender Organisationsaufgaben zeigt als auch deren 
Abweichungen anzeigt ^ ^ . ^ ^ _ « 

Es ist ein weiteres Ziel der voriiegenden Erfindung, ein verbessertes Verfahren zur sichtbaren Darstellung von 
Ergebnissen der Leistungsubenvachung und -analyse in einem Parallekechnersystem zu schaffen, welches dem 
Anwender die Moglichkeit bietet, Software-Routinen in einem parallel verarbeitenden Programm zu bewerten, 
und zwar uber eine problemlose und vorteilhafte graphische Wiedergabe des Ausfuhrungsprofils. 

Um die genannte Aufgabe zu losen, schafft die vorliegende Erfindung ein Verfahren zur sichtbaren Darstel- 
lung von Ergebnissen der Leistungsuberwachung und -analyse in einem ParaUelrechnersystem, bei dem eine 
Vielzahl von Prozessoren ein paralleles Verarbeitungsprogramm ausfuhren, welches aus emer Vielzahl von 
Routinen zusammengesetzt ist Das Verfahren umf aBt die folgenden Schritte: 

(a) Sarameln von Informationen hinsichtlich der Ausfuhrungszeit von jeder Routine, die gleichlaufend durch 
eine Vielzahl von Prozessoren ausgefuhrt wird unter Beriicksichtigung der Klassifizierung der Routinen; 

(b) Ableiten eines Maximalwertes, eines Mittelwertes, eines Minimalwertes und einer Standardabweichung 
der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vielzahl der Prozesso- 
ren gesammelt wurden; und 1 

(c) graphisches Darstellen der Ausfuhrungsprofil-lnformation, welche den Maximalwert, den Mittelwert 
und den Minimalwert und die Standardabweichung der Ausfuhrungszeit jeder Routine enthalt 

Um speziell das weitere Ziel, welches oben eriautert wurde, zu erreichen, wird ein Verfahren zur sichtbaren 
Darstellung von Ergebnissen der Leistungsuberwachung und -analyse fur ein Paralielrechnersystem geschaffen. 



GeraaB dera Verfahren werden Ausfuhningsprofil-Informationen in Form von Baikengraphiken, Kreisgraphi- 
ken Oder Radarkarten dargestellt 

Weitere Ziele neben den obigen, Merkraale und Vorteile der vorliegenden Erfindung ergeben sich aus der 
folgenden Beschreibung in Verbindung rait den beigefugten Zeichnungen, die eine bevorzugte Ausfuhrungsform 
der vorliegenden Erfindung als Beispiel veranschaulicfaen. 5 

KURZBESCHREIBUNG DER ZEICHNUNGEN 

Fig. 1 ist eine Konzeptdarstellung eines Leistungsanalysierersysteras, welches ein Sichtdarstellungsverfahren 
gemaB der vorliegenden Erfindung verwendet; 10 

Fig. 2 ist ein FluBdiagramm, welches einen ProzeB der Modifizierung und Korapilierung eines Prograrams 
zeigt, welches fur ein Parallelverarbeitungssystem geschrieben wurde; 

Fig. 3 ist eine Tabelle, in der Laufeeit-Subroutinen aufsummiert sind, die fur eine Leistungsuberwachung und 
-analyse vorgesehen werden; 

Fig. 4 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 1 beschreibt; 15 

Fig. 5 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 2 beschreibt; 

Fig. 6 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 3 beschreibt; 

Fig. 7 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine #4 beschreibt; 

Fig. 8 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine #5 beschreibt; 

Fig. 9 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 6 beschreibt; 20 

Fig. 10 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 7 beschreibt; 

Fig. 1 1 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine #8 beschreibt; 

Fig. 12 ist eine Tabelle, in der die Informationen aufsummiert sind, die durch das Leistungsanalysierersystem 
der vorliegenden Erfindung zu sammeln sind; 

Fig. 13 ist ein Diagramm, welches ein erstes Beispiel einer Ausfuhningsprofilanzeige gemaB der vorliegenden 25 
Erfindung zeigt, bei der jede Prozedur oder Schleife skaliert ist in bezug auf die Ausfuhrungszeit eines gesaraten 
Programms; 

Fig. 14 ist ein Diagramm, welches ein zweites Beispiel der Ausfuhrungsprofildarstellung zeigt bei der alle 
Prozeduren und Schleif en in gleicher Weise skaliert sind, ungeachtet deren absoluter Ausfuhrungszeiten; 

Fig. 15 ist ein Diagramm, welches ein drittes Beispiel einer Ausfuhrungsprofildarstellung zeigt, in der das 30 
Ausf uhrungsprofil von jeder Prozedur oder Schleife in einer Kreisgraphik wiedergegeben ist; 

Fig. 16 ist ein Diagramm, weldies ein viertes Beispiel der AusfGhrungsprofildairstellung zeigt, in der das 
Ausfuhrungsprofil in einer Radarkarte wiedergegeben ist; 

Fig. 17 ist ein Diagramm, welches ein funftes Beispiel einer Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt; und 35 

Fig. 18 ist ein Diagramm, welches ein sechstes Beispiel der Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt 

BESCHREIBUNG DER BEVORZUGTEN AUSFOHRUNGSFORM 

40 

Eine Ausfuhrungsform der vorliegenden Erfindung soil nun im folgenden imter Hinweis auf die beigefugten 
Zeichnungen beschrieben werdea 

Fig. 1 ist eine Konzeptdarstellung eines Leistungsanalysierersystems, in welchem ein Sichtbardarstellverfah- 
ren gemaB der vorliegenden Erfindung angewandt wird Ein Parallelrechnersystem 1 1 ist durch eine Vielzahl von 
Prozessoren 12a— 12n aufgebaut die als Berechnungselemente dienen und die zusammen laufen, um umf angrei- 45 
che Berechnungsaufgaben zu erzielen, die in einem Parallelverarbeitungsprogramra codiert sind. Solche Prozes- 
soren 12a— 12n umfassen einzein Datensammeleinrichtungen 13a— 13n und eine Datensumraiereinrichtung 
14a — 14n zum Korrigieren und Auf summieren von jeweils Ausfuhningszeitdaten. 

Die Datensammeleinrichtimgen 13a— 13n sammeln in einer Real zeitweise die Ausfuhrungszeitdaten wahrend 
der Progranmiausfuhrung in den jeweiligen Prozessoren 12a— 12n, in denen sie auftreten. Die Ausfiihrungszeit- 50 
daten, die durch die Datensammeleinrichtungen 13a— 13n gesaramelt wurden, werden als Quellendaten fiir die 
Ausfuhrungsprofile verwendet Die Ausfuhrungsprofile bestehen aus einem Satz von Reports, welche die 
Anwender mit Informationen uber die Prozessoren 12a— 12n, daB diese tatsachlich arbeiten, versehen, wodurch 
diese das Programm von verschiedenen Gesichtspunkten aus bewerten konnen. 

Die Ausfuhrungsprofile weisen auf einige bestimmte Programmroutinen hin, welche das Paralielverarbei- 55 
tungsprogramm bilden, wie beispielsweise Prozeduren, Schleifen, eine parallele Verarbeitungsbibliothek, die 
durch das Leistungsanalysierersystem iifaerwacht und analysiert werden. In diesem Sinn werden diese Routinen 
als Subjekte der Profilbildung oder Profilsubjekte bezeichnet 

Die Datensunmiiereinrichtungen 14a— 14n summieren die Ausfuhrungszeitdaten, die durch die Datensammel- 
einrichtungen 13a— 13n gesaramelt wurdea Spezifisch gesagt berechnen sie Maximal-, Mittel-, Minimalwerte so 
und eine Standardabweichung der gesammelten Ausfuhrungszeiten fur jede Routine oder jedes Subjekt fur die 
Profilbildung. Um diese Aufgabe zu erreichen, ist es erforderlich, alle Ausfuhrungszeitdaten zu kompilieren, die 
durch die Datensammeleinrichtungen 13a— 13n an einer einzelnen Stelle gesammelt wurden. Daher befaBt sich 
eine der Datensummiereinrichtungen, wie beispielsweise 14^ mit den Summierungsaufgaben und andere 
14b — 14n senden einfach ihre Daten zu dieser Datensummier-Subroutine t4a unter Verwendung von Inter-Pro- 65 
zessor-Komraunikationspfaden(nicht gezeigt) in dem Parallelrechnersystem 11. 

In Wirklichkeit sind die oben beschriebenen Datensammeleinrichtungen 13a— 13n und die Datensummierein- 
richtungen 14a— 14n in dem Parallelrechnersystem 11 in Form eines Satzes von Subroutinen implenientiert die 
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als ein Teil der Laufzeitbibliothek fur die Parallelverarbeitung vorgesehen sind. Bei der vorliegenden Ausfuh- 
mngsform stehen acht Laufzeit-Subroutinen fur diesen Zweck zur Verfugung, wie in Fig. 3 aufgelistet ist Die 
detaillierten Funktionen der Datensammeleinrichtungen 13a- 13n und der Datensummiereinnchtungen 
1 4a — I4n sollen getrennt unter Hinweis auf die Fig. 4 bis 1 1 beschrieben werderu 
5 Um emeut auf Fig. 1 einzugehen, ist das ParaUelrechnersystera 11 an zwei Datendateien gekoppelt: eine 
Quellencodedatei 15 und eine Profilinformationsdatei 16, Die Quellencodedatei 15 enthalt den onginalen Quel- 
lencode eines Programms, welches durch die Prozessoren 12a- 12n ausgefOhrt werden solL Die Profilinforma- 
tionsdatei 16 speichert Ausfuhrungszeitdaten und deren Sununendaten, wie sie von den Prozessoren 12a- 12n 

benotigt werden. . , n j c u • 

10 Ein Profilanzeigeprozessor 17 analysiert die Inhalte der Profilinformationsdatei 16 und stellt das hrgebnis 
dieser Analyse in einem Ausfuhrungsprofilfenster 22 auf einem Bildschirm einer Anzeigeeinheit 21 dar. Hier 
macht der Profilanzeigeprozessor 17 das Ergebnis der Analyse sichtbar, und zwar unter Verwendung mehrerer 
graphischer Wiedergabetechniken, wie dies an spaterer Stelle in Verbindung mit den Fig. 13 bis 18 beschneben 
werden soIL Eine Eingabevorrichtung 18 wird dazu verwendet, um einige Befehle oder Daten in den Profilanzei- 
15 geprozessor 17 einzugebea 

Bei Verwendung dieser Eingabevorrichtung 18 kann der Anwender dieses Leistungsanalysierersystems einen 
spezifischen Punkt (z.B. eine Prozedur oder Schleife) bezeichnen, der in dem Ausfuhrungsprofilfenster 22 
dargestellt wird Ein Quellencode-Positionsanalysierer 19 sucht nach dem Quellencode, um die Codeposition 
(oder Zeilenzahl) entsprechend dem Punlct herauszufinden, der durch den Anwender bezeichnet worden ist 
GemaB der Codeposition-Information, die durch den QueUencode-Positionsanaiysierer 19 geliefert wird, extra- 
hiert einen Quellencode-Browser 20 den relevanten Teil des Quellencodes 15 und zeigt den extrahierten 
Quellencode in einem Quellencodefenster 23 auf dem Bildschrift der Anzeigeeinheit 21 an. 

Bevor die Programmausfuhrung bei dem oben beschriebenen System gestartet wird, ist es erforderhch, den 
onginalen Quellencode in ein ausfuhrbares Ptogramm zu ubersetzen oder zu kompUieren. Bei der vorliegenden 
Erfindung sollte der Quellencode vor der Kompilierung modifiziert werden, und zwar fur Ubenvachungs- und 
MeBzwecke. Spezifischer gesagt, schiebt das Kompiliersystem Subroutine-Ruf-Zustande in den Quellencode em, 
um einige Laufzeit-Subroutinen fur die Datensaramlung und Summierung an geeigneten Punkten m dem 

Programm aufzuruf en. . i_. - o i r\ jy^ 

Der Quellencode eines parallel verarbeitenden Programms besitzt erne hierarchische Stniktur. uas kto- 
gramm oder die Anwender-Anwendung besteht aus einer Vielzahl von Prozeduren. Eine Prozedur ruft emige 
andere Prozeduren auf; mit anderen Worten konnen Prozeduren verschachtelt werden. Als Tatsache ist der 
Hauptkorper des Programms eine Prozedur, die implizit als "MAIN" bezeichnet wird. die mehrere Abkomm- 
lingsprozeduren enthalt Die Schleife besteht aus einer Sequenz von Befehlen als Teil einer Prozedur, die iterativ 
ausgefuhrt werden. t> * 

Um die paralle Programmausfuhrung zu unterstutzen, sieht das System eine Bibliothek von Routmen vor, um 
eine E>rozeBkommunikation, Synchronisation und andere Aufgaben auszufuhren, die bei der paraUelen Verarbei- 
tung inharent vorkommen. Diese werden als parallel verarbeitende Bibliotheksroutinen bezeichnet, welche 
durch die Prozeduren nach Bedarf aufgerufen werden. Da sie die Systemleistung als parallel laufende Zusatze 
beeinflussen, sind die parallel verarbeitenden Bibliotheksroutinen ein wichtiges Merkmal bei der Ausfuhnmg der 
40 Profilbildxuig, . 

Fig. 2 zeigt ein FIuBdiagramm, welches einen ProzeB der Modifizierung und Kompilierung ernes Progranuns 
fur das Parallelrechnersystem 1 1 zeigt Dieser ProzeB enthalt die folgenden sieben Schritte. 

[SI] Es wird der Quellencode eines parallel verarbeitenden Programms, welches in jedem Prozessor in dem 
ParaDelrechnersystem 1 1 auszufuhren ist, in das Kompilierungssystem eingegeben. 

[S2] Es wird eine Feststellung zum Aufrufen einer Laufzeit-Subroutine # 1 in den Anfangsteil des Hauptpro- 
grammkorpers eingef ugt Die Laufzeit-Subroutine # 1 zeichnet die Zeit auf, wenn das Programm gestartet wird. 

[S3] Es werden FeststeUungen zum Aufrufen der Laufzeit-Subroutinen #2 und #3 jeweils in den AnfangsteU 
und in den Endteil jeder Prozedur eingefugt, die in dem Quellencode enthalten ist * i 

[84] Es werden FeststeUungen zum Aufrufen der Laufzeit-Subroutinen #4 und #5 jeweils in den AnfangsteU 
und in den Endteil jeder Schleife eingefugt, die in den Prozeduren enthalten ist 

[S5] Es werden FeststeUungen zum Aufrufen der Laufzeit-Subroutinen #6 und #7 jeweUs in den Anfangsteil 
und in den Endteil jeder parallel verarbeitenden Bibliotheksroutine eingefugt 
[S6] Es wird eine FeststeUung zum Aufrufen der Laufzeit-Subroutine #8 in den Endteil des Hauptprogramm- 

korpers eingefugt . j- u • j 

[S7] Das KompiUerungssystem ubersetst (oder korapiUert) die QueUencodedatei 15, die nun die bei den 
Schritten S2 bis S6 eingefugten Subroutine-Aufruf-Feststellungen enthalt, in den Objektcode, der durch die 
Prozessoren 12a— 12n ausfiihrbar ist 

Durch Ausfuhren der oben erlauterten Schritte SI bis S7 fugt das KompiUerungssystem emige geeignete 
FeststeUungen in die Quellencodedatei 15 ein. um die Laufzeit-Subroutinen fur die Datensaramlung und Aufsum- 
mierung aufzurufen und es kompiliert die QueUencodedatei 15, um den ausfuhrbaren Objektcode zu generierea 
Als ein Ergebnis enthalt der generierte Objektcode Subroutine-Aufruf-Befehle sowohl an den Start- als auch 
Endpunkten des Hauptprogrammkorpers, der Prozeduren, Schleifen und der parallel verarbeitenden Bibliot- 
heksroutinen. 

Fig, 3 faBt die Laufzeit-Subroutinen, die zum Zweck der Leistungsiiberwachung und -analyse emgefuhrt 
wurden, zusammen. Die Tabelle 30 beschreibt kurz die Funktionen der acht Laufzeit-Subroutinen in deren 
jeweiligen Gelegenheiten, bei denen sie aufgerufen werdea 

Die in dieser Tabelle aufgelisteten ersten sieben Subroutinen (tt 1 bis #7) sind Subroutinen, die zum Sammein 
von Zeitwertzeichendaten und zum Akkumulieren der Ausfuhrungszeit von jedem Abschnitt des Parallelpro- 
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gramms ausgeiegt sind Das heiBt, solche Subroutinen #1 — #7 entsprechend der Datensammeieinrichtung 
13a— I3n in Fig. 1. Die achte Subroutine #8 besteht aus einer Subroutine, die zum Summieren der Daten 
ausgeiegt ist, die durch die Subroutinen #1 bis #7 gesammelt und akkumuliert wurdea Die Subroutine #8 
entspricht sorait der Datensuramiereinrichtung 14a— 14n. 

Urn auf die Fig. 4 bis 11 einzugehen, so das folgende hinsichtlich der detaillierten Funktionen der Laufzeit- 
Subroutinen # I - # 8 erlautert, die in den Quellencode eingefugt sind 

Fig. 4 zeigt ein FluBdiagramni, welches die Laufzeit-Subroutine # 1 zeigt, die dann aufgerufen wird wenn das 
Programni startet zu lauf en und die zwei folgenden Aufgaben vorsieht 

[S 1 1 a] Initialisieren eines ortlichen Datenbereiches, der zum Aufzeichnen und zum Analysieren des Prozessor- 
Verhaltens verwendet wird 

[SI lb] Aufzeichnen des Prograramstartzeitpunktes. 

Die Fig. 5 und 6 sind FIuBdiagramme, welche die Laufzeit-Subroutinen #2 bzw. #3 zeigen. Die Laufzeit-Sub- 
routine #2 wird zu Beginn von jeder Prozedur aufgerufen und wie bei dem Schritt S12a von Fig. 5 gezeigt ist, 
zeichnet sie den Ausfuhningsstartzeitpunkt dieser Prozedur auf. AIs ein Gegenstuck zu dieser Subroutine #2 
wird die Laufzeit-Subroutine #3 aufgerufen, wenn die Prozedur beendet wird und sie fuhrt die folgenden drei 
Aufgaben aus: 

[S13a] Erhalten der Ausfuhrungs-Ende-Zeit der Prozedur. 

[SI 3b] Akkumulieren der Ausfuhrungszeit der Prozedur (das heiBt Akkumulieren der Differenz zwischen der 
Ausf iihrungsstartzeit und der Ausfuhrungs-Ende-Zeit). 

[Sl3c] Akkumulieren der Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 
Prozedur aufgerufen wurde (das heiBt Akkumulieren der Differenz zwischen der AusfOhrungsstartzeit und der 
Ausfuhrung-Ende-Zeit, die durch die Laufzeit-Subroutinen #6 und #7 fur jede parallel verarbeitende Bibliot- 
heksroutine auf gezeichnet wurde). 

Fig. 7 zeigt ein FluBdiagramm der Laufeeit-Subroutine #4, welche aufgerufen wird wenn der Prozessor in 
eine Schleife eintritt Die Schleife umfaBt eine Folge von Befehlen, die iterativ ausgefuhrt werden, und zwar 
unter der Steuerung einer Schleifen-Zahler-Variablen. Jedesmal wenn die Schleife ausgefiihrt wird wird die 
Schleifen-Zahler- Variable erhoht (oder vermindertX und zwar um ein vorbestimmtes Inkrement und es wird die 
Schleife wiederholt, bis die Schleifen-Zahler- Variable einen vorgeschriebenen Grenzwert erreicht oder andere 
Beendigungsbedingungen erfuJIt sind Urn statistische Ausfuhrungsdaten fur die Schleifen zu sanunehi, fuhrt die 
Laufzeit-Subroutine #4 die folgenden zwei Aufgaben durch: 
[S 14a] Aufzeichnen der AusfOhrungsstartzeit der Schleife. 

[S14b] Erhalten des Anfangswertes der Schleifen-Zahler-Variablen und des Inkrements (oder Schleifenzahler- 
SchrittgroBe) fur jede Iteration, und Aufbewahren derselben fur zukunftige Verwendung. 

Fig. 8 zeigt ein FluBdiagranim der Laufzeit-Subroutine #5, die ausgefuhrt wird wenn eine Schleife beendet 
wird Diese fullt die folgenden vier Aufgaben fur jede Schleife, 
[SI 5a] Erhalten der Ausfuhrung-Ende-Zeit der Schleife. 

[SI 5b] Akkumulieren der Ausfuhrungszeit der Schleife (das heiBt Akkumulieren der Differenz zwischen der 
AusfOhrungsstartzeit und der Ausf Ohrung-Ende-Zeit fur die Schleife), 

[S15c] Erhalten des endguitigen Wertes der Schleifensteuer-Variablen und Berechnen der Zahl der Iterationen 
basierend auf den Anfangs- und Endwerten der Schleifen-Zahler-Variablen und der SchrittgroBe. 
[S 1 5d] Akkumulieren der Zahl der Iterationen. 

[S15e] Akkumulieren der Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 
Schleife aufgerufen wird Hier wird die Ausfuhnmgszeit dadurch erhalten, indem die AusfOhrungsstartzeit bzw. 
Ausfuhrungsstartzeitpunkt von dem Ausfuhrung-Ende-Zeitpunkt subtrahiert wird die durch die Laufzeit-Sub- 
routinen #6 und #7 fur jede parallel verarbeitende Bibliotheksroutine aufgezeichnet wurden, die von der 
Schleife aufgerufen wurden. 

Die Fig. 9 und 10 zeigen die Laufzeit-Subroutinen #6 und #7, die aufgerufen werden, wenn eine parallel 
verarbeitende Bibliotheksroutine jeweils startet und endet Das heiBt. die Laufzeit-Subroutine #6 fuhrt den 
folgenden Schritt aus: 

[SI 6a] Aufzeichnen des Ausfuhrungsstartzeitpunktes der parallel verarbeitenden Bibliotheksroutine. 

AIs Gegenstuck zu dieser Laufzeit-Subroutine #6 erzeugt die Laufzeit-Subroutine # 7 folgendes: 
[S 1 7a] Erhalten des Ausfuhnings-Ende-Zeitpunktes der parallel verarbeitenden Bibliotheksroutine, 
[SI 7b] Akkumulieren der Ausfuhrungszeit der parallel verarbeitenden Bibliotheksroutine. wobei die Ausfuh- 
rungszeit die Differenz zwischen dem Ausfuhrungsstartzeitpunkt, der bei dem Schritt SI 6a aufgezeichnet wurde, 
und dem Ausfuhning-Ende-Zeitpunkt, der bei dem Schritt SI 7a erhalten wurde, ist 

Fig. 11 zeigt ein FluBdiagramm, welches die Laufzeit-Subroutine #8 wiedergibt, die am Ende des gesamten 
Programms ausgefuhrt wird Die Laufzeit-Subroutine #8 summiert die Ausfuhrungszeitdaten auf, die durch die 
anderen Laufzeit-Subroutinen # I bis # 7 gesammelt wurden, und zwar gemaB den folgenden Schritten: 
[S18a] Berechnen der mittleren angesammelt Zeit von jeder parallel verarbeitenden Bibliotheksroutine, die 
durch jede Prozedur aufgerufen wurde, gemaB den folgenden Gleichungen: 



Tcp(avg) = -^J] Tcp (m) . . . (1) 

n 

Twp(avg) = -J- J] Twp (m) ...(2) 



m=l 



Top(avg) = Top(m) ...(3) 

worin n eine ganze Zahl ist, welche die Anzahl der Prozessoren wiedergibt, die in dem Parallelrechnersystem 1 1 
iavolviert sind und m eine ganze Zahl ist, die von 1 bis n reicht und dazu verwendet wird, um einen spezifischen 
Prozessor anzuzeigen. Tcp(m) ist die akkumulierte Ausfiihningszeit, welche der m'te Prozessor fur die Komrau- 
nikationsaufgaben verbraucht hat Tcp(avg) bedeutet eine mittlere angesammelte Ausfuhrungszeit, die fur 
Kommunlkationsaufgaben verbraucht wurde. Twp(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Pro- 
zessor fur die Synchronisation verbraucht hat Twp(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit, 
die fur Synchronisationsaufgaben verbraucht wurde. Top(m) ist die akkumulierte Ausfuhrungszeit, die der m'te 
Prozessor f Or Aufgaben verbraucht hat, die anders sind als die Kommunikations- und Synchronisationsaufgaben. 
Top(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit, die fur andere Aufgaben verbraucht wurde. 
[S18b] Berechnen des Maximalwertes, Minimalwertes und der Standardabweichung a fur jede der akkumulier- 
ten Ausfuhrungszeiten Tcp(ra), Twp(m) und Top(m). 

[Sl8c] Berechnen der mittleren akkumulierten Ausfuhrungszeit des Anwenderprograrams gemaB der folgenden 
Gleichung: 



Tup(avg) = |2 T^P^^) 
«=i 

n 

= (Tpp (m) -TCP (m) -Twp (m) -Top (m) ) ... (4) 

worin Tpp(m) die Ausfuhrungszeit bedeutet, die durch den m'ten Prozessor fur die in Betracht stehende 
Prozedur verbraucht wurde und wobei Tup(m)die Netto- Ausfuhrungszeit des Anwenderprograrams bedeutet 

Tup(m)-Tpp(m)-Tcp(m)-Twp(m)-Top(m)) (5) 

[S18d] Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung o fur die akkumulierte 
AusfQhrungszeitdesAnwenderprogramnisTup(m). 

[S18e] Berechnen der mitderen angesammelten Zeit von jeder parallel verarbeitenden Bibliotheksroutme, die m 
jeder Schleife aufgerufen wurde, gemaB den folgenden Gleichungen: 

n 

Tcl (avg) = '^^^ ' " 

Twl(avg) = -j^^ ^1 ..-(7) 

n 

Tol (avg) = ^2 ^ol (m) • . . (8) 

Tcl{m) ist die akkumulierte Ausfuhrungszeit, die der ra'te Prozessor fur Koramunikationsaufgaben bendtigt hat 
Tcl(avg) bedeutet die mittlere angesammelte Ausfuhrungszeit, die fur Koramunikationsaufgaben verbraucht 
wurde. Twl(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Prozessor fur die Synchronisation benotigt hat 
Twl(avg) bedeutet die mitdere akkumulierte Ausfuhrungszeit, die fur Synchronisationsaufgaben verbraucht 
wurde. Tol(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Prozessor fur Aufgaben verbraucht hat, anders 
als die Kommunikations- und Synchronisationsaufgaben. Tol(avg) bedeutet die mittlere akkumulierte Ausfuh- 
rungszeit, die fur andere Aufgaben verbraucht wurde. 

[Sisq Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung a fur jede der akkumu- 
lierten Ausfuhrungszeiten Tcl(m), Twl(m) und Tol(mX 

[S18g] Berechnen der mittleren angesammehen Ausfuhrungszeit des Anwenderprograrams gemaB der folgen- 
den Gleichung: 

n 

Tul(ave) = Tul(m) 

= (Tpl -Tcl (m) -Twl (m) -Tol (m) ) ... (9) 



worin Tpl(ni) die Ausfuhrungszeit ist, die von dem m'ten Prozessor fur die in Betracht stehende Schleife 
verbraucht wurde und Tul(m) die akkumulierte Netto- Ausfuhrungszeit des Anwenderprograrains ist 

Tul(ra)-TpI(m)-TcI(ni)-TwI(ra)-Tol(m)) (5) 
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[S18h] Berechnen des Maximalwertes, des Minimal wertes und der Standardabweichung a fur die akkumulierte 
Ausfuhrungszeit des Anwenderprogramms Tul(m). 

[S18i] Ausgeben der Ergebnisse der Schritte Sl8a bis S18h als eine Profil-Infonnationsdatei 16. 

fig, 12 zeigt eine Tabelle, die die Informationen zusammenfaBt, welche durch das Leistungsanalysierersystem 
der vorliegenden Erfindung gesammelt wurden. In dieser Tabelle 40 sind die gesammelten Informationen in lo 
Einklang mit dem Subjekt der Profilierungsoperationen klassifiziert, welche Prozeduren, Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalten, urn die Konununkation, Synchronisation und andere Aufgaben zu 
unterstutzen. Obwohl in fig. 12 nicht gezeigt, kdnnten bedingte Programmverzweigung auch in dem Profilsub- 
jekt enthalten sein. 

Ira allgemeinen werden Informationen, welche das Prograramverhalten in jedem Prozessor betreffen, an drei js 
verschiedenen Stufen der Ausfuhrung gesammelt: einer vorbereitenden Verarbeitungsstufe, einer Anlauf-Verar- 
beitungsstuf e und einer Datenverarbeitungsstufe (terminal process staged 

Die vorbereitende Verarbeitungsstufe besteht aus einer Stufe, bevor eine bezeichnete Routine als Profilsub- 
jekt aufgerufen wird Die drei Arten der Profil-Subjekte, die in der Tabelle 40 aufgelistet sind, erfordem es 
jedoch nicht, daB Informationen an der vorbereitenden Verarbeitungsstufe gesammelt werden. Wie oben 20 
dargelegt wurde, konnen auch bedingte Programraverzweigungen (in fig. 7 nicht gezeigt) ein Hel der Ausfuh- 
rungsprofilierung seia Wenn dies der Fall ist, werden zusatzliche Befehle in den Quellencode eingefiihrt, um eine 
andere Laufzeit-Subroutine aufzurufen, um Informationen an aktuellen Verzweigungsbedingungen zu sammeln. 
Speziell enthalten solche Verzweigungsbedingungen 'Wahr- oder Falsch-"Bedingimgen als Ergebnis von logi- 
schen Operationen oder "negative, Null- oder positive" Bedingimgen als ein Ergebnis von arithmetischen 25 
Operationen, die vor den Verzweigungsbefehlen ausgefiihrt wurden. Die Laufzeit-Subroutine zahlt das Auftre- 
ten von jeder solcher Bedingungen, bevor eine Verzweigung durchgefuhrt wird, namiich bei der vorbereitenden 
Verarbeitungsstufe. 

Die Aniauf- Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine, die bei einem Profil-Subjekt 
beteiligt ist, zu laufen beginnt Spezieller gesagt, wird die Ausfuhrungsstartzeit an der Anlauf- Verarbeitungsstufe 30 
von jeder Prozedur (siehe 81 2a in fig. 5% Schleife (siehe SI 4a in fig. 7) oder parallel verarbeitenden Bibliotheks- 
routine (siehe S16a in fig, 9) aufgezeichnet Im Fsdle der Schleifen wird der Anfangswert einer Schleifenzahler- 
Variablen und einer Schleifenzahler-SchrittgrdBe zusatzlich zu der Ausfuhrungsstartzeit (siehe SI 4b in fig. 7) 
aufgezeichnet 

Die Datenverarbeitimgsstufe oder Ende- Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine 3S 
dabei ist zu enden. Bei der Ende- Verarbeitungsstufe jeder Prozedur werden die Ausfuhrungszeit der Prozedur 
und die Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die innerhalb der Prozedur 
aufgerufen wurde, akkumuliert (siehe S13b und S13c in fig. 6X wodurch die akkumulierten Ausfuhrungszeiten 
Tpp(mX Tcp(m), Twp(m) und Top(m) erhaiten werdea In ahnlicher Weise werden bei der Ende- Verarbeitungs- 
stufe einer Schleife die Ausfuhnuigszeit der Schleife und die Ausfuhnmgszeit jeder parallel verarbeitenden 40 
Bibliotheksroutine, die innerhalb der Schleife aufgerufen wiu*de, akkumuliert (siehe SI 5b und S15e in fig. 8X 
wodurch die akkumulierten Ausfuhrungszeiten Tpl(m), Tcl(m), Twl(m) und Tol(m) fur die Schleife erhaiten 
werden. Zusatzlich wird bei der Ende- Verarbeitungsstufe von jeder Schleife die Zahl der Iterattonen ebenso 
akkumuliert In bezug auf die parallel verarbeitenden Bibliotheksroutinen wird die Ausfuhrungszeit von jeder 
Routine bei der Ende- Verarbeitungsstufe (siehe S17b in fig. 1 0) akkiunuliert 45 

Die bei den oben beschriebenen drei ProzeBstufen gesammelten Informationen werden am Ende des Pro- 
gramms summiert imd werden dann als eine Profil-Informadonsdatei 16 ausgegeben. Zum Wiederauffinden der 
summierten Informationen aus der Profil-Informationsdatei 16 bietet der Profilanzeigeprozessor 17 Ausfuh- 
rungsprofilsununen dem Anwender dieses Systems an. Ura den Anwender rait einer verstandlichen und informa- 
ti ven Anzeige zu versehen, verwende t der Profilanzeigeprozessor 1 7 verschiedene Darstellungsverf ahren, die ira 50 
folgenden beschrieben werdea 

fig. 13 zeigt ein Diagramm, welches ein erstes Beispiel der aus Ausfuhrungsprofilanzeige nach der vorliegen- 
den Erfindung veranschaulicht In diesem Fall biidet die Prozedur # 1 den Hauptkorper des unter Test stehen- 
den parallel verarbeitenden Programms und es werden die Balkengraphiken fOr die anderen Prozeduren und 
Schleifen hinsichtlich der Ausfuhrungszeit der Prozedur # 1 skaliert (das heiBt die Ausfuhrungszeit des gesam- 55 
ten Programms). 

Die Ausfuhrungsprofilanzeige, die in fig. 13 veranschaulicht ist, enthalt Informationen hinsichtlich der Proze- 
duren # 1, #2 usw. und hinsichtlich der Schleifen # 1, #2 usw. Jede Balkengraphik ist in vier Telle eingeteilt: die 
Anwenderprogramm-Ausfiihrungszeit Tu, die Kommunikationsaufgabe- Ausfuhrungszeit Tc, die Synchronisa- 
tionsaufgabe-Ausfuhrungszeit Tw und eine andere Aufgaben-Ausfuhrungszeit To. Die Aufteilung wird durch 60 
den Profilanzeigeprozessor 17 vorgenommen, und zwar im Einklang mit Mittelwerten der angesammelten 
Ausfuhrungszeitea 

Femer werden die Ergebnisse der statistischen Analyse fiir jede Ausfiihrungszeitkategorie auf den Balkengra- 
phiken uberlagert, wo die minimalen Werte mit einem Stemchenzeichen wiedergegeben sind, die maximalen 
Werte mit einem Symbol "x" wiedergegeben sind und die Standardabweichungen mit einem horizontalen 65 
Liniensegment wiedergegeben sind, welches zwischen diesen gezeichnet ist 

Eine solche gerade Aus- Anzeige der Ausfuhrungsstatistiken eriaubt es dem Anwender, in einfacher Weise die 
Beziehung zwischen dem Anwenderprogramm und parallel verarbeitenden Zusatzen, inklusive Kommunika- 
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tions- und Synchronisationsaufgaben zu unterscheiden. Daruber hinaus kann der Anwender durch das Vorsehen 
der Maximum-, Minimum- und Standardabweichungssymbole auf einen Blick erkennen, m welcher Weise die 
Prozentsatze aktuell schwankea Dieses Merkmal hilft dem Anwender sehr, das Verhalten der Prozeduren und 
Schleifen zu verstehen, die in einem parallel verarbeitenden Programm enthalten smd. so daB dieser die 
Moglichkeit erhalt, zu beobachten. ob das Programm richtig arbeitet oder nicht und die Entscheidung treffen 
kann, ob weitere Programm-Modifikationen erforderlich sind oder nicht, um eine Qualitatsverbesserung zu 

dTCIcKciL 

Fig. 14 zeigt ein Diagramm, welches ein zweites Beispiel der Ausfuhruhgsprofilanzeige wiedergibt Im Gegen- 
satz zu dem ersten in Fig. 13 gezeigten Beispiel. werden bei dem Verfahren nach dem zweiten Beispiel alle 
Prozeduren und Schleifen in den individueUen ZeitmaBstaben sichtbar gemacht, ungeachtet von deren absoluten 
AusfOhrungszeiten. Das heiBt, die Langen der Balkengraphiken sind nicht proportional zu deren jeweiligen 
Ausfuhrungszeitlangen. Die Graphiken in Fig. 14 erlauben es jedoch, daB der Anwender auf emfache Weise die 
Prozentsatze der Programmkomponenten verstehen kann (das heiBt Anwenderprogramm Tu, Kommunika- 
tionsaufgabe To, Synchronisationsaufgabe Tw und andere Aufgaben To), die in jeder Prozedur oder Schleife 

involviertsind. . j « j c 

Fig. 15 zeigt ein drittes Beispiel einer Ausfuhrungsprofilanzeige, bei der zwei Prozeduren # I und #2 m form 
einer Kreisgraphik wiedergegeben sind. Kreisgraphiken erlauben im allgemeinen, daB der Anwender ±e Bezie- 
hung von Komponenten zu einer Gesamtheit einfacher vergleichen kann. Bei diesem dritten Anzeigeverfahrcn 
zeigt em gesamter Kreis von 360 Grad die gesamte akkumulierte Ausfuhrungszeit emer Prozedur oder Schleife 
und vier Sektoren zeigen die Prozentsatze der Anwenderprogramm-Ausfuhrungszeit (Tu), der Kommumka- 
tionsaufgabe-Ausfuhrungszeit (TcX der Synchronisationsaufgabe-Ausfuhrungszeit (Tw) und der anderen Aufga- 
be-Ausfuhrungszeit(To)an. ei • t? 

Fie. 16 zeigt ein viertes Beispiel einer Ausfuhrungsprofilanzeige, bei der das AusfuhrungsprofU m Form emer 
Radarkarte wiedergegeben ist Die Radarkarte in Fig. 16 besitzt vier Achsen entsprechend den vier Programm- 
komponenten. Die akkumuUerten Ausfiihrungszeitwerte (Tu. To, Tw und To) der Programmkomponenten sind 
auf deren jeweiligen Achsen aufgetragen und die aufgetragenen Punkte sind miteinander verbunde^ urn ein 
Polygon zu bUden. Aus der Gestalt dieses Polygons kann der Anwender intuitiv die Egenschaften der Prozedur 
Oder Schleife verstehen, die in einer Radarkarte profiliert sind. , „ j. „ . , j- - c- ic 

Ahnlich den anderen Anzeigeverfahrcn, die soweit beschrieben wurden, umf aBt die Radarkarte, die in Fig. lb 
veranschaulicht ist, Informationen hinsichtlich der Minimal- und Maximalwerte und der Standardabweichung 
der akkumulierten Ausfiihrungszeit Dieses Merkmal ermogUcht es dem Anwender. das Verhalten jeder Pro- 
grammkomponente in einem detaillierteren Wert zuverstehea . r-_c- j c- 

Fig. 17 zeigt ein funftes Beispiel einer AusfuhrungsproFdanzeige gemaB der vorhegenden Erfindung. hm 
Ausfiihrungsprofilfenster 50 besteht aus vier Abschnitten 50a bis 50d. Der erste Abschnitt 50a enthalt die 
Legende der Balkengraphiken, die in den anderen Abschnitten des Fensters 50 dargesteUt smd. Spezieller gesag^ 
definiert die Legende die Farbklassifizierung fiir vier verscWedene Programmkomponenten. die bezeichnet smd 
mit: 

Anwender: Anwenderprogramm. 
Com: ICommunikationsaufgabe- Routine. 
Sync: Synchronisationsaufgabe-Routine. 
Runlib und Gop: andere Routinen. 

Das Ausfuhrungsprofilf enster 50 bei dem funften Beispiel verwendet diese Farbklassifizierung zusammen mit 
demDarstellungsverfahrenwieinFig. 13. . - . t-u n 

Der zweite Abschnitt 50b des Ausfuhrungsprordfensters 50 zeigt em prozedur-gestutztes Ausfuhnmgsprofit 
welches die akkumulierten AusfOhrungszeiten von mehreren Prozeduren, wie beispielsweise MAIN , calcl , 
''calc2",''cputim''und"initaL",aufsummiert . . , . , „ u a\ a tru 

Der dritte Abschnitt 50c des Ausfuhrungsprofilfensters 50 zeigt em fang-gestutztes (caller-based) Ausfuh- 
nmgsprofil. welches die akkumulierte AusfOhrungszeit von jeder Prozedur zusammen mit dem Namen yon 
dessen Fang-Routine (caUer routine) zusammenf aBt Beispielsweise Uest sich die oberste Zeile dieses Abschmtts 
wie folgt: 

calcl < 10,292s > MAIN < UNSPECIFIED 

worin das links bezeichnete "calcl" der Name der Prozedur ist, die durch eine Fang-Routine "MAIN" gerufen 
wurde. Das am weitesten rechts gelegene Zeichen" < UNSPECIFIED" bedeutet, daB die Fang-Routme mcht 
ihren eigenen Programmnamen deklariert und der Inharente Name "MAIN" durch das Analysierereystem 
verwendet wird. Die ZeUe zeigt auch an, daB die akkumulierte Ausfuhrungszeit dieser Prozedur calcl gleich 

1032Sekundenbetragt _ . „ ^ . j j- - j _ 

Die Balkengraphik fur diese "calcr-Prozedur ist farb-klassifiziert gemaB der Legende, die m dem ersten 
Abschnitt 50a definiert ist, wobei vier Teile der Balkengraphik jeweUs die akkumulierten Ausfuhrun^zeiten Tu, 
Tc Tw und To zeigt, und zwar zusammen mit der Anzeige des Minimums. Maximums und der Standardabwet- 

Der vierte Abschnitt 50d des Ausfuhrungsprofilfensters 50 zeigt ein rufer-gestutztes Ausfuhrungsprofil 
Beispielsweise liest sich die oberste Zeile des Abschnitts 50d wie folgt: 

MAIN < UNSPECIFIED inital 

worin die Angabe "MAIN < UNSPECIFIED" den Namen einer Rufer-Routine zeigt und die andere Aufschrift 
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^nitaI*' den Naraen einer gerufenen Prozedur anzeigt Die Balkengraphik fur diese Inital^-Prozedur ist farb-klas- 
sifiziert gemaB der in dera ersten Abschnitt 50a definierten Legende. Sie besteht aus vier Teilen, die jeweils die 
akkumulierten Ausfuhrungszeiten Tu, Tc, Tw und To als auch deren Minimum- and Maximumwerte und 
Standardabweichung mit den zuvor erwahnten Symbolen zeigea 

Fig. 18 zeigte ein sechstes Beispiel der Ausfuhrungsprofildarstellung gemaB der vorliegenden Erfindung. En 5 
Ausfiihrungsprofilfenster 60 besteht aus vier Abschnitten 60a bis 60d. Der erste Abschnitt 60a liefert die 
Legende von BaJkengraphiken, die in den anderen Abschnitten des Fensters 60 dargestellt werden und spezieller 
definiert ist die Farbklassifikation fur vier Programmkomponenten, die bezeichnet sind mit: 
Anwender: Anwenderprogramnt 

Com: Kommunikationsaufgabe-Routine. to 
Sync: Synchronisationsaufgabe-Routine. 
Runlib und Gop: andere Routinen. 

Die Legende umfaBt auch die Farbklassifizierung fur Verzweigungsbedingungen, die enthalt 'Wahr"- und 
Talsch^-Bedingungen fur logische Operationen und "negative", "Null-" und "positive" Bedingiuigen fur arithmeti- 
scheOperationen- 15 

Der zweite Abschnitt 60b des Ausfuhrungsprofilfensters 60 zeigt ein Ausfuhrungsprofil, welches die akkumu- 
lierten Ausfuhrungszeiten fur mehrere Schieifen zusanmienfaBt 

Der dritte Abschnitt 60c des Ausfuhrungsprofilfensters 50 zeigt ein Ausfuhrungsprofil welches die Verzwei- 
gungsbedingungen zusamraenfaBt Die obere Balkengraphik in dem dritten Abschnitt 60c veranschaulicht die 
Prozentsatze von "Wahr^-Bedingimgen und "Falsch^-Bedingungen, die tatsachlich als ein Ergebnis der logischen 20 
Operationen aufgetreten sind Die hintere Balkengraphik veranschaulicht die Prozentsatze von "positiven", 
"Null-" und "negativen" Bedingungen, die tatsachlich als ein Ergebnis der arithmetischen Operationen aufgetre- . 
ten sind 

Der vierte Abschnitt 16d des Ausfuhrungsprofilfensters 60 liefert ein gerufenen-gestutztes (caller-based) 
Ausfuhrungsprofil, welches das gleiche ist wie bei dem dritten Abschnitt 50c in Fig. 17. 25 

Zusammenfassend fur die Fig. 12 bis 17 gibt die vorliegende Ausfiihrungsform die Ergebnisse der Leistungs- 
analyse wieder, und zwar unter Verwendung einer Vielfait von Darstellungsverfahren. Neben der Mdglichkeit, 
die mittlere Ausfuhrungszeit von jeder Sub jekt- Routine darstellen zu kdnnen, zeigt das vorliegende Analysierer- 
system die Maximum-, Minimum- und Standardabweichung der Ausfuhrungszeiten, wodurch der Anwender die 
Mdglichkeit erhalt, mit einem Blick zu erkennen, wie die Prozentsatze tatsachlich schwanken. 30 

Bei der vorliegenden Ausfuhrungsform analysiert das Leistungsanalysierersystem das Parallelrechnersystem 
1 1 (siehe Fig. 1), welches aus vielfachen Prozessoren # 1 bis # n besteht Jedoch kann die vorliegende Erfindung 
auch auf ein einzeines Prozessorsystem angewandt werden, welches vielfache Aufgaben ausfuhrt, und zwar 
durch Verwendung eines Zeitteilungsverfahrens. In diesem Fall sammeln mehrere geeignete Laufzeit-Subrouti- 
nen Ausfuhrungsdaten fur einzelne Prozesse oder Module, welche virtuell parallel laufen und das Leistungsana- 35 
lysierersystem summiert die gesammehen Daten auf und stellt die Ergebnisse als Ausfuhrungsprofile dar. Wie 
bei der vorliegenden Ausfuhrungsform zeigt das Ausfuhrungsprofil, welches auf einem Bildschirm dargestellt 
wird, mittlere. Minimum- und Maximum-Ausfuhrungszeiten und die Standardabweichung von dem Mittelwert 
hinsichtlicb der Subjektprozesse oder Module. 

Die vorangegangene Beschreibung dient lediglich der Veranschaulichimg der Prinzipien der vorliegenden 40 
Erfindung. Da femer vielf altige Modifikationen und Anderungen fur den Fachmaim offensichtlich sind, ist nicht 
beabsichtigt, die Erfindung auf die exakte Konstniktion und Anwendungen zu beschrankeo, die beschrieben 
wurden, und demzufolge fallen alie geeignetea Modifikationen und aquivalenten Ausfuhrungea in den Rahmen 
der Erfindung gemaB den anhangenden Anspruchen und deren Aquivalente. 

45 

Patentanspruche 

1. Verfahren zur sichtbaren Darstellung von Ergebnissen einer Leistungsuberwachung und -analyse fur ein 
Parallelrechnersystem, bei dem eine Vieizahl von Prozessoren ein parallel verarbeitendes Programm aus- 
fuhren, welches aus einer Vieizahl von Routinen zusammengesetrt ist, wobei das Verfahren die folgenden so 
Schritte umfaBt: 

(a) Sammeln von Informationen hinsichtlicb der Ausfuhrungszeit von jeder Routine^ die gleichlaufend 
durch eine Vieizahl von Prozessoren ausgefuhrt wird unter Berucksichtigung der KJassifizierung der 
Routinen; 

(b) Ableiten eines Maximaiwertes, eines Mittelwertes, eines Minimalwertes und einer Standardabwei- 55 
chung der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vieizahl der 
Prozessoren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhrungsprofil-Information, welche den Maximalwert, den Mittel- 
wert und den Minimalwert und die Standardabweichung der Ausfuhrungszeit jeder Routine enthalt 

2. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine akkumu- bo 
liert wird jedesmal, wenn die Routine aufgerufen und ausgefuhrt wird 

3. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine gesam- 
melt wird, die als ein Subjekt der Profilierung bezeichnet wurde. 

4. Verfahren nach Anspruch 1, bei dem bei dem Schritt, (a) die Routinen in ein Anwenderprogramm, 
Kommunikationsaufgaben, Synchronisationsaufgaben und andere Aufgaben klassifiziert werden. 65 

5. Verfahren nach Anspruch 3, bei dem das Subjekt der Profilierung Prozeduren, Schieifen und parallel 
verarbeitende Bibliotheksroutinen enthalt 

6. Verfahren nach Anspruch 1, bei dera bei dem Schritt (b) femer die Standardabweichung der Ausfuhrungs- 
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zeit von jeder Routine zusatzHch zu dem Maximalwert. dem Mittelwert und dem Minimalwert berechnet 
wird. 

7. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) Rufer-Routinen und/oder Gerufener-Routinen 
aus den Routinen in dem parallel verarbeitenden Programm extrahiert werden und die Ausfuhnmgsprofil- 
information, welche zu den extrahierten Routinen gehort, dargestellt wird. 

8. Verfahren nach Anspruch 1 , bei dem bei dem Schritt (c) eine Balkengraphik verwendet wird, um graphisch 
die AusfuhrungsproFilinformation von jeder Routine darzustellea 

9. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Kreisgraphik verwendet wird, um graphisch 
die Ausfiihrungsprofilinformation von jeder Routine darzustellen. 

10. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Radarkarte verwendet wird, um die 
AusfuhrungsproFilinformation von jeder Routine graphisch darzustellea 

1 1. Verfahren nach Anspruch 1, welches femer die folgenden Schritte umfaBt: 

(d) Annehmen einer Bezeichnung eines Punktes der Ausfuhrungsprofilinformation, die bei dem Schritt 
(c) dargesteUt wird, und 

(e) Darstellen eines Teiles des Quellencodes des parallel verarbeitenden Programms, welches dem 
bezeichneten Punkt der Ausfuhrungsprofilinformation entspricht 

12. Ein computer-lesbares Medium, welches rait einem Computer-Programm codiert ist, bei dem das 
Verfahren nach Anspruch I implementiert ist 

Hierzu 18 Seite(n) Zeichnungen 
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